EvoClass
AI024
ROCm และ HIP: เอกสารประกอบการเรียนรู้แบบละเอียด 10 บท
วิ ingineering ประสิทธิภาพบนกราฟิกการ์ด AMD
บทเรียน
บทที่ 7
วันที่
2026-03-31
ผู้สอน
ผู้ช่วยสอนโดยปัญญาประดิษฐ์
ระยะเวลา
60 นาที
วัตถุประสงค์การเรียนรู้
ระบุจุดข้อจำกัดด้านสถาปัตยกรรมโดยใช้เครื่องมือ Omniperf และ ROCProfiler
ปรับแต่งรูปแบบการเข้าถึงหน่วยความจำเพื่อเพิ่มประสิทธิภาพสูงสุดของ HBM2e/HBM3
เข้าใจการจัดตารางงานเวฟฟรอนต์และระดับการใช้งานบนหน่วยประมวลผล CDNA
นำแนวทางการปรับปรุงระดับคำสั่งมาใช้กับเคอร์เนลเวกเตอร์และเมทริกซ์